In article the proposal of modification of spectral clustering method for nominal, ordinal, interval and ratio data, based on procedure of Ng, Jordan and Weiss [2002], is presented. In construction of affinity matrix we implement function Aik = exp(σ * dik ) (σ – scale parameter) with distance measures dik appropriate for different scales of measurement. This approach gives possibility of conversion nonmetric data (nominal, ordinal) into interval data.
The proposed method of spectral clustering can be successfully used in all classification problems, including the measurement, analysis and visualization of preferences.
spectral clustering, distance measures, scales of variables
[1] Ackoff R.L. (1969), Decyzje optymalne w badaniach stosowanych, PWN, Warszawa.
[2] Dudek A. (2012), A comparison of the performance of clustering methods using spectral approach, W: J. Pociecha, R. Decker (red.), Data analysis methods and its applications, Wydawnictwo C.H. Beck, Warszawa, 143-156.
[3] Fischer I., Poland J. (2004), New methods for spectral clustering, Technical Report No. IDSIA-12- 04, Dalle Molle Institute for Artificial Intelligence, Manno-Lugano, Switzerland.
[4] Girolami M. (2002), Mercer kernel-based clustering in feature space, „IEEE Transactions on Neural Networks”, vol. 13, no. 3, 780-784.
[5] Hubert L., Arabie P. (1985), Comparing partitions, „Journal of Classification”, no. 1, 193-218.
[6] Karatzoglou A. (2006), Kernel methods. Software, algorithms and applications, Rozprawa doktorska, Uniwersytet Techniczny we Wiedniu.
[7] Kolupa M. (1976), Elementarny wykład algebry liniowej dla ekonomistów, Panstwowe Wydawnictwo Naukowe, Warszawa.
[8] Ng A., Jordan M., Weiss Y. (2002), On spectral clustering: analysis and an algorithm, W: T. Dietterich, S. Becker, Z. Ghahramani (red.), Advances in Neural Information Processing Systems 14, Cambridge, MIT Press, 849-856.
[9] Poland J., Zeugmann T. (2006), Clustering the Google distance with eigenvectors and semidefinite programming, Knowledge Media Technologies, First International Core-to-Core Workshop, Dagstuhl, July 23-27, Germany.
[10] Shortreed S. (2006), Learning in spectral clustering, Rozprawa doktorska, University of Washington.
[11] Steczkowski J., Zelias A. (1981), Statystyczne metody analizy cech jakosciowych, PWE, Warszawa.
[12] Steczkowski J., Zelias A. (1997), Metody statystyczne w badaniach cech jakosciowych, Wydawnictwo AE, Kraków.
[13] Stevens S.S. (1946), On the theory of scales of measurement, „Science”, Vol. 103, No. 2684, 677-680.
[14] Verma D., Meila M. (2003), A comparison of spectral clustering algorithms. Technical report UWCSE- 03-05-01, University of Washington.
[15] von Luxburg U. (2007), A tutorial on spectral clustering, Max Planck Institute for Biological Cybernetics, Technical Report TR-149.
[16] Walesiak M. (1990), Syntetyczne badania porównawcze w swietle teorii pomiaru, „Przeglad Statystyczny”, z. 1-2, 37-46.
[17] Walesiak M. (2005), Rekomendacje w zakresie strategii postepowania w procesie klasyfikacji zbioru obiektów, W: A. Zelias (red.), „Przestrzenno-czasowe modelowanie i prognozowanie zjawisk gospodarczych”, Wydawnictwo AE, Kraków, 185-203.
[18] Walesiak M. (2006), Uogólniona miara odległosci w statystycznej analizie wielowymiarowej. Wydanie drugie rozszerzone. Wydawnictwo AE, Wrocław.
[19] Walesiak M. (2009), Analiza skupien, W: M. Walesiak, E. Gatnar (red.), Statystyczna analiza danych z wykorzystaniem programu R, Wydawnictwo Naukowe PWN, Warszawa, 407-433.
[20] Walesiak M., Dudek A. (2009), Odległosc GDM dla danych porzadkowych a klasyfikacja spektralna, Prace Naukowe UE we Wrocławiu nr 84, 9-19.
[21] Walesiak M., Dudek A. (2010), Klasyfikacja spektralna z wykorzystaniem odległosci GDM, W: K. Jajuga, M. Walesiak (red.), Klasyfikacja i analiza danych – teoria i zastosowania, Taksonomia 17, Prace Naukowe UE we Wrocławiu nr 107, 161-171.
[22] Walesiak M., Dudek A. (2011), clusterSim package, URL http://www.R-project.org.
[23] Wisniewski J.W. (1986), Korelacja i regresja w badaniach zjawisk jakosciowych na tle teorii pomiaru, „Przeglad Statystyczny”, z. 3, 239-248.
[24] Wisniewski J.W. (1987), Teoria pomiaru a teoria błedów w badaniach statystycznych, „Wiadomosci Statystyczne”, nr 11, 18-20.
[25] Zelnik-Manor L., Perona P. (2004), Self-tuning spectral clustering, W: Proceedings of the 18th Annual Conference on Neural Information Processing Systems (NIPS’04), http://books.nips.cc/nips17.html.